罗学科等:出版人工智能概念内涵、价值指向与实践路径
点击蓝字关注我们
摘要
以知识挖掘为代表的人工智能技术将带来出版业生产工具的智能化,实现产业内生产关系和生产流程的重构。基于知识与服务两大要素探讨出版业智能化转型的方向,从生产侧提质增效和消费侧价值洞悉的双视角探索出版人工智能的实践路径,并从底层、核心功能层和业务层探索建构出版产业智能化的方法论,这将有助于实现出版机构从内容供给商向供给侧与需求侧双向链接的智能服务商转型。出版承担着传播社会主义核心价值观的内在功能和时代诉求,对人工智能应用的数据安全、文化安全等需要有效监管,以实现出版业新旧动能的转换和高质量发展。
原文刊登于2021年02期
原题为《出版人工智能:概念内涵、价值指向与实践路径》
随着以算力、算法、大数据为基石的人工智能成为“新基建”的驱动引擎,数字经济正进化到以人工智能为核心驱动力的智能经济新阶段。2019年3月召开的中央全面深化改革委员会第七次会议审议通过了《关于促进人工智能和实体经济深度融合的指导意见》。会议指出,促进人工智能和实体经济深度融合,要把握新一代人工智能发展的特点,坚持以市场需求为导向,以产业应用为目标,深化改革创新,优化制度环境,激发企业创新活力和内生动力,结合不同行业、不同区域特点,探索创新成果应用转化的路径和方法,构建数据驱动、人机协同、跨界融合、共创分享的智能经济形态。[1]
从提供知识信息到引导辅助决策,人工智能正在作为一种通用技术向人类日常生活的所有领域渗透。因此,我们讨论任何社会问题,都不能脱离这样一个宏观背景,出版问题更不能例外。一方面,纵观通信技术与出版产业的发展历程,历次通信技术的革新都会颠覆出版产业现存模式,带来流程再造和革新生态体系。互联网快速发展的20多年来,出版行业走过了基础软硬件的配置、知识资源数字化的过程,并通过IT系统沉淀了丰富的业务资源,这无疑是下一步智能化升级建设的基础。另一方面,文化出版事业以知识传承、知识创新和价值创造为使命,承载着传播社会主流价值的功能属性,在与技术创新的跨界融合中,不能忽略人工智能应用中的伦理与价值观导向。
本文将尝试提出“出版人工智能”这一概念,并厘清其内涵、价值指向,将知识、服务两大要素纳入转型升级的框架,探讨人工智能在出版领域应用的多样性、层次性、动态性和适应性。研究将从供给侧和需求侧的维度入手,分析出版智能化转型升级的创新路径,探索出版行业高质量发展新动能、新空间、新范式,展望智能经济下的出版行业产业转型的新图景。
出版人工智能:
概念内涵与价值指向
深度学习、知识挖掘无疑代表着人工智能技术的发展前沿,以知识挖掘为代表的人工智能技术将带来出版业生产工具的智能化,实现产业内生产关系和生产流程的重构。[2]
首先,通过文本分析、自然语义分析、机器学习、人工干预等方式,以知识挖掘为代表的人工智能技术可以在出版领域深入应用,实现知识库的不断循环更新。即:从知识网络的构建、知识库的生产(显性知识的收集、隐性知识的显化)、新知识的自主形成、知识的解释与评价,带来知识库不断循环更新,进而形成一系列知识成果(见图1)。这不仅带来了知识点的打碎、解体、剥离;实现了知识与知识之间关联、重组,并挖掘出知识间可见与不可见关系的呈现;关联之后产生关键连接点、将重组后的知识交付给用户。同时,人工智能通过自主感知和自主学习,自主生成不同来源和不同结构的知识,并自主适应场景和自主解决问题。
图1 知识挖掘流程图
其次,基于智能技术驱动的知识挖掘使得知识表达和知识服务发生变革,提供以用户需求为驱动的个性化、多样化、高效化的内容样态和产品体系,并实现知识内容的载体与终端、应用场景的智能化适配。
基于此,笔者认为,出版人工智能是以知识作为生产要素,以基于人工智能的知识挖掘作为核心技术,带来新知识的自主形成和规模化使用,并实现人工智能技术在出版领域应用的系统工程。出版人工智能具有快速性、迭代性、自主性、定制化、交互性、系统性等特点,将带来出版行业生产、交互、体验和载体的革新。
快速性意味着利用智能分析和知识挖掘加速新知识的诞生、挖掘显性和隐性知识;提高内容筛选效率、质量内容的审核把关和知识的转化。在出版等文化产业的生产环节,人工智能可以快速胜任数据库和素材库建设、题材拟定和选择、辅助或独立创作、内容改编、审核校对、载体转化等工作。
迭代性则是指迭代用户知识需求的预判和诊断、动态反馈用户需求的个性化需求并优化匹配,解决出版业效率衰减的问题,建立服务闭环。用户在内容消费的同时,大量的行为数据和命令都会被系统学习并不断修正,通过深度学习技术,系统会根据细分场景下的用户共性需求与行为特征,以及每个用户的个性化需求不断迭代用户知识需求的预判和诊断,精准定义并且准确满足当下场景下的用户需求。
自主性是指随着数据沉淀越来越丰富,在感知、认知、决策过程中,机器将越来越自主地做出最优选择和快速判断。智能技术将不仅能执行精确定义的任务,而且可以基于语义识别、情感计算等技术理解人的需求并给出解决方案。
一个深度个性化的阅读时代正在到来,兴趣优先、注重体验与个体价值的展现正在成为用户核心需求。定制化意味着通过大数据技术,阅读中的生产行为和反馈与兴趣偏向已实现双向打通,可以实时动态修正内容供给,将内容生产带入到颗粒度更细,维度更立体的时代。
交互性则意味着,基于语音技术的完整高效的对话技能、对话流和知识建设能力,人机交互将更自然、更好地服务用户。目前,基于人工智能的问答和语音交互阅读技术已运用到出版领域。例如国内的小爱同学、小度同学、国外的亚马逊智能音箱,可以实现语音自定义交互,让机器听得懂读者需求,直接反馈出用户想看的书并实现交互式聊天。
系统性是指在技术层级和应用层级、生产逻辑、管理机制和组织形式上需要建立一套体系。人工智能的应用将使得流程间的边界不再清晰,因此行业必须重新思考生产力的优化和生产关系的构建尤其是技术与非技术要素的融合。
世界经济正处于从信息经济向知识经济转型的关键时期,知识经济转化的核心是以数据为驱动,实现知识的自主形成和规模化利用,以转型升级实现数字化、网络化、云化、智能化的知识经济系统。[3]因此,以知识挖掘为代表的人工智能技术将使得出版企业实现从垂直化的内容供给商到匹配内容供给与消费两端的智能服务商的转型升级。[4]
出版人工智能的
实践路径
出版人工智能的价值机理是人工智能嵌入出版文化产业价值链的体系重塑,是供应侧和需求侧的效能创新与多重优化。出版领域的供应链、产业链、价值网的关系会因知识流、智能流与生态因素而动态调整。
基于出版人工智能的思路,笔者认为,出版行业可以在生产侧、消费侧进行智能化转型,对全生态链业务、管理与服务进行重构,构建扁平化和协同化的出版人工智能系统,进而实现供需对接、产销交互(见表1)。
生产侧提质增效:
搭建“知识生产超级编辑部”
在出版传媒领域,知识的数据化程度越来越高,人工智能的运用可以实现知识的组织、知识的生产、新知识的自主生成和知识的多样化应用。目前,人工智能技术在辅助内容创作、提升内容制作效率、创新交互形式等方面深入结合,例如新华社的第一位机器人记者“快笔小新”、腾讯的写稿机器人Dreamwriter、第一财经的“DT稿王”等。
因此,出版行业应从技术底层、核心功能层和业务层实现生产的智能化转型。即,基于知识图谱、自然语言处理、多模态语义理解、智能搜索与推荐等AI核心技术搭建知识生产超级编辑部,升级审校、写作、编辑、甄选等环节。知识生产超级编辑部在底层对接各种不同来源和形式的数据,核心功能层为出版机构提供知识生产、知识加工、知识应用能力;上层支持不同业务环节和板块,包括智能审校、智能写作、智能编辑、创建行业知识数据库等功能。通过知识计算、关联、重组,提高知识数据的关联性,构建有序的、相关联的知识图谱,实现知识的协同创新和价值最大化。
第一,在智能审校层面,智能审校系统为创作、编辑、审核、发布等各环节的人员提供辅助的内容审核及校对服务,确保文化传播安全。基于自然语言处理和深度迁移学习技术,出版机构可利用依据行业规范、标准和业务知识搭建智能审校解决方案,并根据分词结果及当前词条的上下文语义关系,自动识别出知识点并创建索引,有效提升校对质量及审稿效率,确保内容安全生产。[5]同时,人工智能系统可以快速对文字、语音、图像、视频等内容审查鉴定以及与侵权案例进行大数据分析比对,筛除存在思想、道德、政治等问题的内容。
第二,在智能写作上,人工智能可以根据主题主动采集内容数据,对内容数据进行自动化的鉴定、审核与筛选,智能分类聚合;同时人工智能可通过信源控制和语义分析,防止不良内容传播。未来的智媒时代,人工智能将打破传统内容生产流程的桎梏,实现完全智能化内容创作、跨媒体语义理解和多媒体内容精细编辑。智能写作目前主要运用于大型互联网平台和主流媒体的某个业务场景中,并在重大突发事件的报道中起到不可或缺的作用。例如,2017年8月8日四川九寨沟发生7.0级地震后,机器人仅用时25秒就通过中国地震台网官方微信平台率先全球推送地震信息。此外,在内容生产领域,人工智能的应用正在催生出文化行业的新形态,如人工智能文学、人工智能影视、人工智能音乐、人工智能游戏等,尤其是创意性创作。如人工智能机器人“微软小冰”通过“学习”近100年间中国现代诗人数万首诗歌作品和400年艺术史上200多位人类画家画作,实现文本、语音和视觉的内容生成,先后出版了现代诗集《阳光失了玻璃窗》和原创绘画作品集《或然世界》。[6]
第三,在智能编辑和智能推荐上,机器学习技术实现内容摘要的快速生成。例如在网络小说IP的影视化改编中,过往的流程是,影视文学编辑需要以人工的方式先看完小说,并分析改成电视剧、网剧或者动画片的可能性;对于动辄千万字的网络小说,这一过程工作繁重、费时费力。但是现在基于深度学习技术,机器在短短的几十分钟内就可以将书中的几十位主要人物、上百位次要人物的关系图谱、人生节点、情感连接进行可视化输出。人工智能技术可以执行大量重复性的工作,之后再由编辑去阅读重点段落,实现以人工智能优选文化IP并快速辅助其产权交易和开发利用,提升效率,带来IP消费的延伸和优化,挖掘知识IP的数据价值。这些能够极大地丰富文化产品供给,能够创造出超现实的虚拟世界、超物理的文化景观、超想象的文化体验,进而有效刺激文化消费需求,拓展文化消费市场。[7]
第四,基于知识挖掘技术,人工智能应用可以赋能出版业挖掘沉淀多年的数据价值,积极打造开放性行业数据库和知识库。基于知识图谱构建能力,出版机构可将散落在所有出版物里的知识集纳、整理,关联并形成体系,提高可解释推理的知识应用能力,最大限度地发挥知识效能。例如:深度挖掘各类金融数据的潜在关联与风险模式以及法律行业和医疗行业的知识资源,提升金融机构抵御风险的能力、辅助审判和辅助诊断;优化出版业资源配置,增多创新外溢、加快转型升级。
消费侧价值洞悉:
“私人的知识服务中心”转型
作为出版产业的价值实现层,消费侧离不开对用户体验、使用和反馈的认知。AI的本质是对人的理解,是从根本上发掘、调动人的智能效用,推动人的成长和创造,连接内容与服务,实现知识的传播与再生产。因此,出版人工智能应打通用户需求和知识服务间的通道,形成完整消费数据闭环和深刻的消费者洞察,消弭出版社与用户之间的链接障碍,实现对供给侧的反向推动。
如表1所示,出版人工智能可以“私人的知识服务中心”为转型导向,实现消费侧的价值最大化。即:一方面在底层通过用户需求动态分析、场景捕捉等向用户输出个性化、精准化的知识服务;另一方面通过大数据采集系统,对接用户即时反馈和自生成的信息,进行知识再生产、加工和转化。同时在生产工具的赋能下,依托智能化平台为用户提供知识聚合、知识关联、知识表达和知识呈现等服务,帮助每一位用户成为知识的创造者和贡献者,实现知识领域的良性循环。
未来,人工智能在消费侧有更深入的应用空间。
第一,借助人工智能快速精准地分析消费者偏好和需求,进而主动为其提供内容分发、产品推荐、个人定制、供需对接等服务。[8]用户的每一个轨迹、每一次驻留、每一个行为都对应一组数据,同时智能终端多样化发展拓宽内容消费场景。
第二,出版机构可以开发多元化的智能应用程序,向用户提供更多的文化消费平台和工具,如智能分级阅读等。智能分级阅读可以依据用户的阅读喜好、知识层次、阅读内容难度、内容质量、阅读数量和阅读效果,给出定向、定位、定级、定质、定量、定效的阅读和学习指导;同时通过语料库升级和智能化交互技术,搭建起个性化适配、周期化伴随的分级阅读模型,建立阅读能力指标框架。
第三,对于消费者,人工智能降低了其进入文化生产、传播和出版的门槛,任何人都有可能成为文化产品的生产者和出版者,成为数据提供者和价值创造者,成为文化生产的众筹、众包和众创者。智能辅助写作将带来消费侧的变革,训练与提高用户的写作能力,提供资源服务清单,依托深度学习技术建构大规模本体知识库、语料和规则库,解决语义、推理和语法搭配问题,实现智能技术在写作教学领域的应用,可广泛运用在大学生写作与沟通语言智能训练中心等学习场所。
第四,出版人工智能将伴随个人的生命历程和学习成长周期。在教育出版服务领域,出版方可以借助知识图谱、数据标注等技术对个人特征、学习偏好维度等进行分析,搭建符合能力模型设计、具备评价诊断机制的终身学习的长周期链路,重构教育、培训与终身学习形态,通过实践、复盘、迭代来搭建完整的教育闭环。并且,知识学习的过程中将贯穿着对人的潜质评估,知识的供给和消费将实现越来越精准的匹配。人工智能将与教育出版业紧密结合,搭建持续追踪、跨域理解、定期诊断的学习闭环,再造新的教育和培训供给模式。
挑战与展望
出版作为文化传播事业的重要组成部分,人工智能的应用在给出版产业带来新旧动能转换的同时,也必须考虑其潜含的科技伦理、责任主体难以追究、人文主义与“道德过载”[9]等问题。
首先,算法黑箱的问题,即算法是否存在歧视和纰漏、算法将突出显示哪些数据、基础数据的准确性问题以及数据算法中还缺乏对于知识间因果关系的可解释性等现状。其次,正确的价值观与文化信仰是出版事业可持续发展的灵魂与内在引领,因此人工智能在出版领域的应用必须注重内容安全的把关、伦理审查、价值观引导的问题。再次,目前,人工智能软件越来越多地运用在批量化生产网络文学上,因此人工智能生成内容在著作权法中的定性问题、内容独创性问题也亟待在政策法规层面明确厘清。最后,出版智能化体系的标准化问题,例如智能写作、智能分级阅读的体系搭建,即内容标准的智能化定位、定级和定效等问题。
要解决上述问题与挑战,第一,相关政策制定者要做好顶层设计,建立完善监管制度并推动标准化体系的建设,对人工智能应用的数据安全、文化安全等进行有效监管。第二,专业出版服务要继续在垂类延伸,向更精细化、衍生服务的边界拓展,加强产品的品控;进一步优化其产业链、价值链和创新链。第三,作为蕴含创意和创造力的文化事业,出版承担着传播社会主义核心价值观的内在功能和时代诉求,编辑出版工作不可能完全由机器取代。智能技术的辅助侧重于专业性审核,从而将内容生产和编辑团队从程序性、重复性劳作中解放出来,使其有更多精力进行创作、研发、创意、设计、策划等活动,从而有利于优化从业者结构、提高文化生产效率、加快文化创新速度;提高内容创造者和编辑团队的价值感、启动力,实现专业人才的价值。第四,出版行业要转变思路,拥抱智能化,主动优化迭代,将人工智能从技术向价值跳跃,实现场景化落地,实现出版业新旧动能的转换和高质量发展。
当前,恰逢新基建带动产业新一轮爆发性增长,人工智能与出版的融合发展将成为产业革新的重要利器,推动出版产业数字化向出版智能化转型的有序进化。
参考文献
[1]习近平主持召开中央全面深化改革委员会第七次会议强调 把稳方向突出实效全力攻坚 坚定不移推动落实重大改革举措[N].人民日报,2019-03-20
[2][3]李杰.工业人工智能[M].上海:上海交通大学出版社, 2019
[4]刘枫.5G出版业的革新路径:知识传播中介到智能匹配平台[J].编辑之友,2019 (7)
[5]陈进才.人工智能时代出版流程再造的机遇与挑战[J].现代出版,2020(2)
[6]微软小冰在对200位画家的学习基础上,完成了一本原创绘画集[EB/OL].https://baijiahao.baidu.com/s?id=1676508502769333777&wfr=spider&for=pc
[7][8]王光文.基于人工智能应用的文化产业发展系统问题及优化[J]. 深圳大学学报(人文社会科学版),2020(3)
[9]解学芳,臧志彭.人工智能在文化创意产业的科技创新能力[J].社会科学研究,2019(1)
作者简介
罗学科,博士,教授,博士生导师。主要从事先进制造技术和智能装备及传感测试技术研究,近年来关注知识挖掘与出版业人工智能方面的研究。是西安理工大学,北方工业大学兼职教授。1995年4月获得北航工学博士学位后参加工作。曾任北方工业大学副校长,现任北京印刷学院校长、国家教指委机械类专业指导委员会委员,兼任中国印刷设备与器材协会副理事长,中国印刷高等教育联盟理事长。是享受国务院政府特殊津贴专家,北京市新世纪百千万人才,北京市科技新星,北京市高等教育教学名师奖获得者;二次获得国家教学成果奖,二次获得省部级科技进步奖。发表论文100多篇,出版教材著作译著20多部,发明专利授权15项。
黄莹,北京印刷学院新闻出版学院讲师,博士毕业于北京大学,曾为加拿大西门菲莎大学、加拿大数字媒体中心访问学者。研究领域为智能出版、人机传播、数字媒体的社会使用等;多篇研究发表于Mobile Media & Communication, Learned Publishing 等SSCI和CSSCI权威期刊,并两次获得国际传播学会(ICA)地区年会“优秀论文奖”。
权威,学术,更多精彩尽在
2021《中国出版》
敬请订阅!
新闻出版工作者的益友
新闻出版研究者的平台
投稿邮箱:zgcb@vip.sina.com
订阅电话:010-87622016